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Abstract 

To calculate the number of ancestor of an individual from any biparental reproduction specie is 
necessary to use an statistical approach. It's not possible to build the progenitor's tree only assuming 
that the spice has a sexual biparental reproduction. In particular it not true that the simple progression 
of 2* +1 describes in a realistic way the number of ancestors after a few generations. The reason is that 
when we go back in generations the probability of some ancestors been relatives has an increase. This 
implies a restriction in the ancestor's mean number respect of 2 i+1 . Although this number correspond 
to the maximum ancestor's number in the i-generation. 

Considering the possibility of blood relationship between the ancestors, we show how to re-build 
the progenitor's tree by modeling our problem with a Markov's Chain. First we work in a continuous 
time variable and then by doing a discretization process we obteined the ancestor's distribution. Using 
covariant derivative in a proper way we normalized the distribution and included the interaction's scale. 
Also we obtained the ancestor's distribution it's first and second moments. Finally we calculated the 
entropy associated to the distribution in order to ensure that it's grows with the generation's number. 

Abstract 

El problema de calcular el numero de ancestros de un individuo a la generation t, perteneciente a 

una especie que se reproduce en forma biparental, de poseer una solution, debera estar determinada 

estadisticamente. Pues no es posible reconstruir todo el arbol de los sucesivos progenitores, que sigue un 

orden cronologico, partiendo solo del supuesto de que la especie se reproduce de esa manera. 

En particular, no es valida la sencilla progresion del numero de ancestros a la generation t, dada por 
2 t+i 

ya que al retroceder cronologicamente la probabilidad de que antepasados nuestros sean parientes 
entre sf aumenta. Esto implica una restriction del numero medio de ancestros respecto del valor 2 t+1 . 
Sin embargo, sabemos que tal valor corresponde al maximo numero de ancestros posible para la i-esima 
generation. 

Considerando la posibilidad de que exista consanguinidad entre los ancestros hemos mostrado, en 
primer lugar, de que manera podemos reconstruir el arbol de progenitores a traves de una cadena de 
Markov en tiempo discreto, embebida en una cadena en tiempo contmuo. Formalizamos esta propuesta 
operando con aquel proceso contmuo en forma auxiliar, para obtener, por reduction al caso discreto, 
nuestro proceso original. En segundo lugar, damos cuenta de la distribution de probabilidades de obtener 
n ancestros en la generation t. Aplicamos la notion de derivada covariante, concepto utilizado en la 
geometria diferencial y en las teorias cuanticas de campo actuates, para incluir la escala de la interaction. 
Es decir, a fin de renormalizar la distribution encontrada al numero de ancestros. Identificamos la 
consanguinidad como la interaction perturbativa del proceso primigenio, que daba lugar al valor 2*. 
Con estas ideas calculamos los dos primeros cumulantes: el valor medio y la varianza, como funcion de 
la generation. En tercer lugar, obtuvimos la entropla asociada a la distribution renormalizada, con el 
fin de verificar que la information estadistica del numero de ancestros disminuye, conforme retrocedemos 
generation tras generation. 



1 Introduccion 



El objetivo de este trabajo es elaborar una teoria que permita estimar el numero medio de ancestros de 
un individuo pertenciente a una especie de reproduction gamica. Posteriormente los resultados que se 
desprendan de dicha teon'a seran contrastadas con la information existente acerca de las distribuciones 
reales de ancestros para individuos. 

Entendemos por el termino ancestro a un progenitor, es decir un antepasado directo, o recursivamente, 
a un progenitor de un ancestro y asf sucesivamente. 

Indicaremos con i, el numero de generaciones, de manera que i—0 senale la generation de progenitores, 
i=l la generation de progenitores de progenitores, etc. Denotaremos por Y(i) a la cantidad de ancestros de 
la n-esima generation. En principio Y(z) estara definida sobre el conjunto natural N, donde incluiremos al 
por una cuestion de conveniencia. 

El proceso definido como la adicion progresiva de ancestros en cada generation no es estocastico. Si 
designamos a una generation arbitraria como la inicial (i=0), el mecanismo de induction es el que permite 
obtener toda la secuencia de ancestros. Un individuo de la generation inicial posee dos progenitores (por 
hipotesis de reproduction bipartental), lo mismo diremos para cualquier otro individuo de una cadena de 
ancestros, por aquel formada. Dados dos progenitores cogeneracionales cualesquiera de esa cadena, cada uno 
posee 2 progenitores distintos entre si. Concluimos que la cantidad de ancestros se arboliza como potencias 
de 2 ad infinitum, por lo tanto, el numero de ancestros de la i-esima generation es 



La distribution asociada a Y(z) es P[Y(i) = m] = S m2 i+i, entendida como una certeza absoluta sobre 2* 
frente a todos los valores del conjunto N. En este caso se cumple ademas que 



con j < i. Es decir, podemos escribir el proceso como una sucesion {Y(i)} n de eventos independientes, por 
tanto libres de correlation estadlstica. 

Al proceso descrito por la progresion geometrica de ancestros lo denominaremos pirdmide ancestral. Este 
ultimo termino denota la obsoleta forma de reconstruir la secuencia de progenitores y la razon de ello la 
encontramos en el siguiente absurdo. Intuitivamente podemos vislumbrar una incosistencia tomando en 
cuenta que el numero de ancestros dado por 2 i+1 es creciente hacia generaciones pasadas, mientras que la 
poblacion mundial es creciente hacia generaciones futuras. Para fijar ideas, consideremos a un individuo 
perteneciente a una generation que estableceremos como la actual. El numero de sus ancestros a la i-esima 
generation es, como se ha dicho, 2 l+1 . Consideremos un intervalo de tiempo en el cual crece el numero de la 
poblacion bajo estudio, si el numero de ancestros de un individuo siempre crece hacia generaciones pasadas, 
entonces el argumento falla en contra del crecimiento demografico orientado hacia la actualidad. 

Observemos el siguiente ejemplo: supongamos que queremos calcular el numero de ancestros para un 
individuo perteneciente a una poblacion de seres humanos. Para i — 33 observamos que el resultado de 
hacer esta operation da un numero mayor de individuos que la poblacion actual (del orden de 6.500 millones, 
[1]). Sabemos que la poblacion mundial fue incrementandose en el transcurso del tiempo. Por lo tanto, 34 
generaciones atras siquiera existfan suficientes personas contemporaneas disponibles para ser ancestro del ya 
mentado individuo. 

Otra manera de descartar la progresion geometrica la encontramos en los indicios experimentales de 
endogamia 1 en la poblacion bajo estudio. Habremos encontrado que 2' +1 no puede dar el numero de ancestros 
a la n-esima generation, pues los eventos del proceso no son independientes y, por tanto, es erroneo considerar 
a S m2 i+i como la distribution del numero de ancestros. 

De esta forma, suponer que la sucesion 2 4+1 nos da el numero de ansestros nos lleva a un absurdo cuya 
solution es suponer que en alguna generation tuvo lugar una union de tipo endogamica. La cual conve- 
nientemente ejercida 2 viene precisamente a debilitar la hipotesis inductiva, anteriormente enunciada, dando 

1 Endogamia: union o reproduction entre individuos de ascendencia comun. 

2 La razon de ser de todo sistema endogamico es defender la homogeneidad de un grupo, de manera que este se mantenga 
siempre igual a si mismo y diferenciable de todos los demas. La unidad del clan es la razon suprema. Entendemos a la endogamia 
como el rechazo a la incorporation de miembros ajenos a un grupo en particular. 



Y(i) = 2 l+1 



(1) 





2 



lugar a la consanguinidad generacional. La debilitation de esta la hipotesis es de tipo estadi'stica, piies no se 
sabe cual generation produce una restriction al numero de ancestros. A continuation mostramos 3 ejemplos, 
en los que podemos observar que la information de consanguinidad entre individuos cogeneracionales afecta 
a la generation siguiente 



i = 2 



i- 1 




Fi gure 1: Este es el caso trivial en que no hay consanguinidad generacional. El proceso completo esta gobernado por la ley 

2 t+i_ 



1=2 




Figure 2: Izquierda: es el caso en que los progenitores son primos hermanos. Derecha: mostramos una union comun en la 
generacion de progenitores de progenitores. 

Hasta ahora hemos utilizando como unica restriction la posibilidad de parentesco entre individuos co- 
generacionales. Es valido preguntarse si existe alguna causa adicional que modifique dicho valor. Una de 
ellas sera considerar si el hecho de que la poblacion este aislada es un factor dctcrminantc para el calculo 
propuesto. De ser asf ^que tamano deberia tener esa poblacion de manera que implique una restriction apre- 
ciable en el resultado? Para contestar a estas preguntas centremonos en una dada generacion, la i-esima. 
Dado que 2 l+1 es la cota superior en el numero de ancestros de esa generacion, podemos decir que, cuando 
la poblacion sea del orden de 2 l+1 se podra hablar de una restriction adicional a la consanguinidad, tal como 
la hemos considerado anteriormente. 

Proseguiremos el analisis suponiendo como unica restriction la consanguinidad de individuos cogenera- 
cionales. De esta manera, el parentesco entre progenitores interconecta los sucesos, de manera que, el proceso 
real no consta ya de eventos independientes, sino que existe cierto tipo de interaction entre generaciones 
dada por un flujo de information generacional. Consideraremos a cada generacion como a un eslabon que 
forma parte de una sucesion de eventos concatenados. 

En este trabajo estudiaremos el caso en el que estos eslabones estan interconectados de manera que el 
proceso completo, ahora estocastico, sea una cadena de Markov. La razon por la que hemos utilizado un 
proceso de Marov radica en que estos generalizan la notion de independencia estocastica [2] , que da lugar en 
nuestro caso, a la piramide ancestral. Por tanto, emplearemos variables aleatorias para dar cuenta de una 
teoria estocastica, de manera que, las fiuctuaciones estadfsticas perturben la distribution S m 2i+i ■ 



3 



2 Sobre la evolution temporal 



Para definir un lenguaje comun, daremos algunas definiciones. Un proceso de Markov es una subclase de 
la clase de los denominados procesos estocdsticos, esto es una familia de variables aleatoria {X(i)} t , donde t 
representa un parametro del conjunto T. 

La teoria de las cadenas de Markov, consiste en la generalization mas simple, que permite que el resultado 
de cualquier ensayo dependa del resultado del ensayo inmediatamentc anterior (y solamente de el) . El valor 
de la variable aleatoria ya no esta asociada a una probabilidad a priori, sino que existe una manera de 
conectar dos valores de esta variable a traves de una probabilidad condicional. 

Por lo general el parametro t hace referencia al tiempo. Si el conjunto T es numerable diremos que se 
trata de un proceso en tiempo discrete y si es no numerable, por ejemplo T C R + = {[0,oo)} ; hablaremos 
de un proceso en tiempo contmuo. En este trabajo los resultados del proceso, espacio muestral de X(i), 
perteneceran a un conjunto numerable. 

Lo que distingue a un proceso de Markov del resto de los procesos estocasticos es la denominada propiedad 
de Markov. Para el caso en que T = N, el parametro t es alguno de los elemenos de la sucesion ordenada 
{t k ■ k e N} 

P[X(t„+i) =x n+1 \X(t ) = x ,...,X{t n )=x n ]=F[X{t n )=x n \X(t n _ 1 ) = x n _ 1 ] (3) 

mientras que para el caso en que T C R + , para cada t, s, e R + tenemos 

P[X(i + s) = n\X(u) = a; (it), < u < t] = P[X(i) = n|X(i) = x(t)] (4) 

Las expresiones (3) y (4) dan cuenta de la misma propiedad que gobierna este tipo de procesos: la probabili- 
dad condicional del estado futuro dado todos los anteriores (presente y pasados) depende del estado presente 
y es independiente del estado pasado. 3 Suele decirse que este tipo de procesos no tienen memoria, o al menos 
no la tiene a largo plazo, pues solo basta con recodar la information del estado actual para evolucionar al 
estado siguiente. 

La cadena particular para estudiar el problema de ancestros debe estar definida en tiempo discrete Ahora 
bien, a fin de hacer uso del calculo diferencial y demas ventajas que seran manifestadas luego, podemos 
considerar la cadena de Markov del proceso de ancestros como inmersa dentro de una cadena en tiempo 
contmuo. El parametro real t es una medida del lapso de tiempo entre eventos. El proceso discreto queda 
embebido (e incluido) en un proceso conti'nuo que estudiaremos en detalle. 

Para contemplar todas estas ideas, debemos redefinir la categoria de la variable del numero de ancestros, 
ahora en tiempo contmuo Y(i), que en adelante sera una variable aleatoria definida por 

Y(t) := 2 t+1 - X(t) (5) 

de manera que la variable aleatoria X(i) de cuenta del numero de ancestros que son parientes entre si. 

El conjunto de variables aleatorias {X(t)} t describe la dinamica completa. 4 Esta secuencia de variables 
aleatorias puede definirse sobre un espacio muestral A numerable. 

Debemos decir que no consideraremos una distribution para cada generation que nos permita dictaminar 
cual es el origen de la correlation entre generaciones. Es decir, no daremos information sobre la probabilidad 
de que los progenitores sean primos, hermanos, etc. Si ocurre que para algun t la variable X(t) ^= 0, queremos 
significar que hay una restriction del numero de ancestros y no hacer referencia a la causa que origino esa 
disminucion en Y(t), respecto de 2* +1 . No distinguiremos entre las distintas formas de partentesco de los 
ancestros cogeneracionales, sino que contaremos solamente si existe o no una restriction por consanguinidad. 
Esto nos permite simplificar nuestra teoria, pues nos lleva a considerar procesos homogeneos, en los que la 
probabilidad de transition infinitesimal entre generaciones es independiente de t. 

En lo sucesivo describiremos al proceso de consanguinidad mediante una cadena en tiempo conti'nuo 
descrita por {X(i), t <G R+} y mostraremos de que manera el mismo es una perturbation al proceso descrito 
por la piramide ancestral. 

Definimos la matriz de transferencia como "P„ m (t, s) = P[X(t) = n|X(s) = m], con s < t, cuyos elementos 
son las probabilidades de transition. La propiedad de Markov (4) implica que los elementos de matriz 

3 Los terminos futuro, presente y pasado hacen referencia a un orden temporal, pero no necesariamente cronologico. 
4 Equivalentemente {Y(t)}t tambien describe la dinamica, pues {X(t)}t es un proceso de Markov si y solo si {Y(t) = 2* +1 — 
X(t)}< es un proceso de Markov. 
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anteriores satisfacen la ecuacion de Chapman-Kolmogorov [2] 

V nm (t, s) = V nk (t, u)V km (u,s) (6) 
k 

con s < u < t. 

Para un dado t los sucesos son mutuamente excluyentes, entonces P[X(t) = n\X(t) = m] = S nm o en forma 

matricial V(t,t) = I. 5 Se definen los elementos del generador infinitesimal, asociado a la matriz V(t,s) 
como: 

Qij (t) = lim + £ . f )-^j (7) 

El proceso se dice homogeneo si y solo si las transiciones no dependen de la generation actual sino solo 
de la diferencia entre generaciones. Esto es equivalente a que el generador Q sea independiente de t, i.e. las 
probabilidades de transition entre un tiempo t y otro t + e, con e infinitesimo, no dependen de t. e 

La dinamica del proceso queda determinada por el conocimiento de la distribution de probabilidades 
P[X(i) = n] =: p n (t), Vn g A,\/t € M. + , asociada a la variable aleatoria X(i), o equivalentemente del con- 
junto de las probabilidades de transition (probabilidades condicionales) P[X(i) = n|X(,s) = m] =: V nm (t,s), 
V(m, n) e A x A, V(s, t) e R + x R+. 

Hemos dicho que para cada t los sucesos son mutuamente excluyentes, esto implica que 

Pn(t + e) = ^2V nk (t + e,t)p k (t) (8) 

Esta expresion tiene la siguiente interpretation: en el tiempo t + e la probabilidad de encontrar de n re- 
strictions es el resultado de una transition desde alguno de los estados de k restricciones al tiempo t. Esta 
considerada la posibilidad de que no exista transition (k = n) y la variable X tome el mismo valor en t y 
t + e. Con lo cual se obtiene 

Vnk (t + e,t)p k (t) -5 nk pk (t) 

keA 

d t p n (t) = Qnfc(*)PfcW (9) 

keA 

Definimos el vector P(t) cuyas componcntes sean las distribuciones {p„(i)} n , podemos escribir a partir 
de (9) d t P(t) — Q(t)P(t), y que para el caso en que el proceso sea homogeneo se reduce 

d t P(t) - QP(t) (10) 

El conocimiento del generador infinitesimal Q junto con las condiciones iniciales para el vector P(i), 
determinan la solution del problema. Prueba de ello se encuentra en la form expli'cita de la solution unica 
[2] para P(t), que es P(t) = cxp(tQ) P(0). 

La variacion temporal del vector P(t) es nula si y solo si no hay interaction entre las generaciones. 7 
Esto demuestra que la interaction propuesta, que es el resultado de la consanguinidad de progenitores, se 
comporta como una perturbation del proceso descrito por la piramide ancestral. 



p„(t + e) - p n (t) 



lim 

e->0 



p n (t + e) -p„(t) 



5 La demostracion de esto se hace como sigue, considero P[X(t) = n, X(t) = m] = <5 nm P[X(t) = m]. Por otro lado, la 
probabilidad condicional la podemos escribir P[X(t) = n|X(t) = m] P[X(t) = m] = P[X(t) = n,X(t) = m], entonces P[X(t) = 
n|X(t) = m] = 8„m 

6 La demostracion de esto se basa en que las probabilidades de transicion toman la forma V n m{t, s) = Vnm,(t — s), con s < t 
y junto con la definition (7) del generador infinitesimal, implica que Q(t) = Q. El reciproco puede mostrarse escribiendo la 
serie de Dyson para las probabilidades de t ransicidn, Pnm(^, 

7 La demostracion de esto se hace como sigue, la solution de (10) es P(t) = cxp(iQ) P(0), luego la variacion nula de P(t) se 
da si y solo si Q = 0, con lo cual las probabilidades de transicion entre generaciones son nulas y obtenemos que no existe flujo 
de information entre generaciones. 
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3 Sobre el proceso particular 



Formalizaremos el problema, de manera que el valor medio de ancestros, definido por a(t) : = (Y(t)), tenga 
la forma: 

a{t) = (2 t+1 - X(t)> = 2* +1 - c(t) (11) 

donde c(t) = (X(t)) es el termino que restringe, por consanguinidad, al numero de ancestros. 

Definimos las distribuciones de probabilidades ty m {t) := P[Y(t) = m] y p n {t) ■= P[X(i) = n]. De la 
correlation (5), obtenemos *}3 m (t) = p n (t), cuando m = 2 t+1 — n. Notemos que (2* +1 ) = 2* +1 si y solo si la 
distribucion esta normalizada i.e. J2neAPn{t) = Smes^PmW — 1, con Ay B espacios muestrales de las 
variables X(i) e Y(t). Este requisito de la norma sera satisfecho por la distribucion que daremos finalmente. 

Asi el valor medio de Y(t) puede escribirse usando (5) 

(Y(t)> = ^(2 t+1 -n)p„(t) = 2*+ 1 -(X(t)> 

neA 

que es precisamente la ecuacion (11). 

Vamos ahora a obtener una ecuacion de evolucion para la distribucion {p n (t)} n . Empezaremos trabajando 
en el espacio muestral A = N. Veremos que esto implica una condition de borde para el estado n = 0. 

Para el caso general desarrollamos cada elemento de la matriz real segun el primer argunmento V(t+e,t), 
a primer orden para e pequeno: 

V nk (t + e,t) = S nk + ed t Vnk(t,s)\ s=t + . . . = 5 nk +eQ nk (t) + ... (12) 

si consideramos un e suficientemente pequeno en (8), el proceso es tal que en una evolucion temporal 1 1 — ► t+e 
solo son posibles las transiciones a los estados inmediatamente proximos e incluso esta la posibilidad de que 
no exista transicion: V nm (t + e, t) = si \n — m\ > 1. Para n / 0: n i — > {n —l,n,n +1}, mientras que 
para n = 0: n i — > {n, n + 1}. Solamente estas posibilidades excluyentes configuran la variedad de estados 
a partir de una evolucion temporal infinitesimal, para n ^ 0, Vt: X^fee{-i o 1} ^nkit + e,t) = 1, Ve pequeno 
para n = 0, Vt: J2ke{o,i} ^nkit + e,t) = 1, Ve pequeno. 

Escribimos exph'citamente la forma de la matriz de transicion para 

f ii k (t)e + 0(e) k = n+l 

V nk (t + e,t) = I l-i/ fc (t)e-Wfe(t)e + 0(e) k = n 

{ u k (t)e + 0(e) k = n-l 

con 0(e) es una funcion de la conjunto {g(t) : lim £ _ >0 = 0}. Mientras que para n = 

v (t . et \-l »k(t)e + 0(e) k = n + l 

ynkKt + e ' t} -\l-v k {t)e + 0{e) k = n 

Para el caso homogeneo, las transiciones infinitesimales se reducen a 



li k e + 0(e) k = n + l 

V nk {t + e,t) =V nk {e) { 1 - v k e - [i k t + 0{e) k = n 

v k e + 0{e) k = n-l 



(13) 



para n^Oy 



r n k{t + e,t)=V nk {e) 



u- 



fjt k e + 0(e) k = n+l 

v k e + 0(e) k = n 



(14) 



por lo tanto para 



Pn(t + e) = [1 - v n t - fi n e + 0(e)]p n (t) + \v n _ x t + 0(e)]p n _i(t) + [n n +ie + 0(e)]p n+1 (t) 



p n {t + e) -p n {t) 



V n + Un + 



0(e) 



Pn(*) + 



t'n-l + 



0(e) 



Pn-l(t) + 



fJ-n+1 + 



0(e) 



Pn+l(t) 
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tomando cl limit e e — > 



d t Pn(t) = ~{v n + H n )p n {t) + J/„_ip„_i(t) + H n+1 p n+1 (t) 

repetiendo el razonamiento anterior para el caso en que n — conclui'mos que las ecuaciones de evolution 
tienen la forma 



d t Pn(t) = ~{v n + Vn)Pn(t) + V n -lPn-l(t) + Mn+lPn+l(*) 

d t p (t) = -v> p (t) + MiPi(*) 
Comparando (15) con (10) podemos identificar los elementos de la matriz Q 



Q 



(15) 





Mi 













-Mi - v \ 


M2 











V\ 


-M2 - ^2 


M3 











^2 


-M3 - v z 


M4 



(16) 
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La dinamica descrita por estas ecuaciones son materia conocida en el campo de los procesos de nacimiento- 
muerte (birth-dead process) estudiados en la teoria de colas (queueing theory) [3]. Estudiaremos el caso 
particular en que las probabilidades de transition no dependan del estado que tome la variable aleatoria 
X(i), i.e. Vk — v y Mfc+i = M; Vfc G N. La razon de ello se encuentra considerando el problema de ancestros 
desde un enfoque dado por la teoria de colas. La ecuacion (15) responde a un proceso no ramificado de una 
cola y un servidor. Desde esta perspectiva el proceso puede verse como un casting de viejos. Esto es, en 
cada generation t, hacemos formar a toda la humanidad cogeneracional y realizamos la clasificacion de si es 
o no ancestro del individuo en cuestion. Definimos a la variable aleatoria T + (T_) que indica el tiempo de 
espera para que un individuo de la generation i-esima sea ingresado (egresado) definirivamente al conjunto 
de ancestros de ese arbol. La probabilidad P[T + > t\X(t) = k] no puede depender del valor que tome la 
variable aleatoria X(t) y como el proceso es homogeneo, entonces la distribution de los tiempos de espera T± 
es exponencial [3] P[T + > t\X(t) = k] = e~ tVh . Luego Vk — v, Vfc e N. Repitiendo el mismo razonamiento 
para T_ obtenemos Mfe+i = M> Vfc € N. 

Por otro lado, puesto que T± esta distribuida exponencialmente entonces (T + ) = ^, de igual manera 
(T_) = -, es el tiempo medio de espera que tienen todos las personas cogeneracionales a t para ser atendidas. 
Estos tiempos deben ser iguales, pues, en el lapso de tiempo entre una generation y otra, todas las personas 
cogeneracionales deben ser atendidas. 

Recordando que el proceso a estudiar es en tiempo discreto y ademas que la unidad minima de tiempo 
es de una generation, entonces (T±) = 1. Por lo tanto y k = v= l = ^ = [ik+i, Vfc € N. Esto reduce 
significativamente las ecuaciones (15) y el generador infinitesimal (16) a las formas 



dtp n (t) = -2p„(t) +p„-i(t) +p„+i(t) 



d t p (t) = -p (t) +pi(t) 



(17) 



Q 





1 













I— 1 


-2 


1 













1 


-2 


1 













1 


-2 


1 






(18) 



Respecto de la condition inicial P(0) diremos que para t—0 tenemos certeza absoluta sobre el numero de 
ancestros Y(0) = 2 esto implica X(0) = 0, por tanto p„(0) = S n0 , o en forma vectorial 



P(0) = (1,0,...) T 
La solucion explfcita de (15)-(19) tiene la forma [3] 

Pn{t) = e- 2t [I n (2t) + I n+1 (2t)} 

donde /„ (x) es la funcion de Bessel modificada. 



(19) 
(20) 
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3.1 Calculo de los primeros momentos 



En primer lugar sabemos que X^neN In{%) — > e + ^ x ^ uniformemente en toda la recta real [4]. Lo cual nos 
permite escribir la norma de la distribucion y demostrar que 5Z neN pn(i) — > 1 uniformemente en toda la 
recta. 

Con esta information se demuestra que todas la series de la forma 

6 fc (i) = ]Tn fc p„(t) (21) 

nGN 

con k e N, convergen uniformemente Vt. Para probarlo definimos la serie X„ eN Pn(i) z n , para z€R. Si esta 
converge entonces define a la funcion generatriz, denotada por gt{z). Para cada t, hemos demostrado que 
<?t(l) — > 1 unformemente, luego por el teorema de Abel [5], X)neNP™(^) z ™ — ^ 9t( z ) uniformemente para 
z G [0, 1], luego la serie puede derivarse termino a termino, con lo cual ^Z neN (n-fc)t P"ft) — > ®z k 9t( z )\z=i 
uniformemente Vt. Finalmente, como &k{t) puede obtenerse a partir de una combination de las series 
d z kg t (z)\ z =i, esto completa la demostracion. 

Considerando la convergencia uniforme podemos derivar termino a termino la serie (21) y usando (15), 
podemos obtener una ecuacion diferencial para los dos primeros cumulantes: el valor medio y la varianza, 
independientemente del conocimiento expli'cito de la solution p„(t). 

Diremos acerca de la varianza, que es indistinto calcularla para X(t) o Y(i), pues la distribucion esta 
normalizada a 1, en cfccto 

aj(t) = <[Y(t) - (Y(t))] 2 ) = ( [2 t+1 - X(t) - (2 t+1 - X(t)>] 2 ) = ([X(t) - (X(t))] 2 ) = a(t) 

En adelante, denotaremos simplemente a(t) = <7x(t) = a^{t). 

Para el caso general con [i y v arbitrarios, estos cumulantes tienen la forma 

d t c(t) = fip (t) + {v- n) 

d t a(t) = 2(v - /i)c(i) +v + n~ fj,p (t) - 2c{t)[fj,p (t) + v - fi] 

recordando que p„(0) = 6 n o, entonces las condiciones iniciales toman la forma c(0) = 0y cr(0) = 0. 
Las expresiones anteriores, para el caso en que fi = 1 = v, se reducen a 

c(t) = / p Q {t')dt' (22) 
Jo 

a(t) = 2t- [ p {t')dt'-2 [ [ p {t')p (t")dt'dt" (23) 



JO JO JO 

Las expresiones (22)-(23) nos muestran que para determinar c(t) y a(t) es suficiente conocer la distribucion 
po(t), es decir, la probabilidad de que el ntimero de ancestros tome el maximo valor posible (2 t+1 ) para esa 
generation. 

Para obtener una expresion anali'tica de estos dos cumulantes, podemos resolver (22) y (23). O bien, 
mediante la identidad nl n (x) — — I n +i{x)], calcular por definition c(t) y a(t) 



c(t) = J2 npnV) = e- 2t [2t h{2t) + (2t + |) I (2t)\ - \ (24) 

nGN 

a(t) = J2[n- c(t)] 2 p„(t) = 2t + \ - e- 2t [2t h(2t) + (2t + \) I {2i)] - c 2 Jt) (25) 



Hemos obtenido los cuantificadores de la interaction: el valor medio, la varianza, la entropia. 

Esta teorfa admite ademas un corolario cuantitativo a medida que nos alejamos generacionalmente, la 
consanguinidad debe aumentar estadisticamente. La demostracion de esto puede hacerse a partir de (22) 
d t c(t) = po{t) > 0, i.e. (X(t)) es monotonamente creciente con t. 
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3.2 Acerca de la necesidad de renormalizacion de la teoria 



Hemos mostrado que la distribucion p n (t) dada por (20) esta normalizada sobre todo el conjunto natural N. 
De alii que la interaction irrisoria, pues, el orden de la interaction (X(f )) es mucho menor que 

2* +1 . Esto se debe a que hemos elegido, por simplicidad, que la variable aleatoria X(t) este distribuida sobre 
el conjunto N. Sabiendo que para cada t existe un valor maximo que puede esta puede tomar, mostraremos 
que si consideramos el espacio muestral real obtendremos la escala correcta de la interaction. 

Los espacios muestrales X(i) y Y(t) estan bium'vocamente relacionados por (5). Partiendo de la certeza de 
que hay descendencia, el valor nu'nimo de Y(t) es 2. Pues, si fuese igual a entonces no habria descendencia, 
en contra de la hipotesis initial, y si fuese igual a 1 estariamos fuera del problema, respecto a que la 
reproduction es biparental. Entonces tenemos que Y(t) G [2, 2* +1 ] C N, luego el espacio muestral de X(£) es 
E t = [0, tit] Q N, siendo n t = 2* +1 — 2 el maximo valor que puede tomar X(t) para un dado t. Si queremos 
utilizar este espacio muestral finito para describir el proceso, existiran dos bordes n = y n = lit, con lo 
cual las ecuaciones de evolution (17) se ven ligeramente modificadas 

C -Pn(*)+Pn+1(*) n = 

d t pn(t) = < -2p n (t) + p n +i(t) + p n -i(t) < n < tit (26) 
[ -pn-i(t) + p n (t) n = n t 

Para este tipo de ecuaciones siempre existe una solution que satisface (26) y X^"'=oPn(*) = 1 [6]> con 1° cua l 
la distribucion de probabilidad que se obtiene toma valores menores que la distribucion real. 
El primer cumulante tiene la forma 

n t __ 
c(t) = ^2 n 9n(t) = ^2 n u ( n * _ n)p n (t) 

donde u(t) es la funcion escalon unitario. Derivando a ambos miembros la ecuacion anterior y repitiendo el 
mismo razonamiento de la section anterior para fj, = 1 = v 

c(t)= / po(r)dT+ f [p n jT)n T d T n T -p nT (t)}(1t (27) 
Jo Jo 

la ecuacion (27) posee un termino de borde, n = n t , que no esta presente en la expresion (22). El orden del 
valor medio viene dado por el termino de borde dominante 

0[c(t)} - 2* (28) 

Recuperamos el caso anterior si tomamos el h'mite n t — > oo y como lim^oo p n (t) = el termino de 
borde extra se anula y obtenemos nuevamente (22). 

Como la solution del problema en el espacio muestral N es mas simple que en el espacio muestral E t , a fin 
de hallar la escala correcta de la interaction, debemos renormalizar la distribucion mediante la transformation 
g : p n (t) — 5- Pn{t) — A(t)p n (t). Exigiremos dos requisitos sobre esta transformation: dejar invariante la 
forma de la ecuacion de evolution (17) y reescalear la interaction de manera que 0[c(t)] ~ 2*. 

La covarianza de (17), a traves de g, implica que p n (t) y p*i{t) corresponden al mismo proceso de Markov, 
i.e. ambos poseen el mismo generador infinitesimal Q. 

Mostraremos que el requisito de covarianza queda satisfecho si g es una transformation de gauge, esto 
implica la incorporation de una derivada covariante. En efecto, transformamos (15) por g, para n^O 



d t p* n (t) - d t A(t)p n (t) + A(t)d t p n (t) 

(*) 
A(t) 



dtP* n {t) - ^nr-p*n(t) = -(/in + " n ) P*n(t) + "n-1 P* n -l{t) + /*n+l P* n+ l{t) 



micntras que para n = 



d t p*(t) = d t A(t)p {t) + A(t)d t p (t) 



dtP* (t) ^PoW = PoW + Mi Pl(t) 
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denotando por ru(t) — d< jfff a la funcion de gauge, podemos definir a la derivada covariante como: 

Q t = dt - w(t) (29) 
de manera que p*(t) satisface una ecuacion de la misma forma que (15) 

ftPn(*) = -K + Mn)PnW + ^-lClW + /*n+lPn+l(*) 

La action de la derivada covariante sobre p n (t) renormaliza la distribucion al numero de ancestros en 
cada generacion. Tal transformacion debe ser independiente de la generacion t, de manera que dt afecte por 
igual a la distribucon en cada generacion, i.e. Vt: zu(t) = co, con luego A(t) = X t+a , dados A, a, G R. 

El conjunto de transformaciones g, definidas por A(i) = X t+a , define un grupo abeliano de Lie de dilata- 
ciones sobre el espacio vectorial al cual pertenece P(i). 

Si transformamos por g a los cumulantes (24)- (25) obtenemos 

fl : c(t) — ► A*+ a c(t) - A*+ a { e ~ 2t [2t J^i) + (2t + \) I (2t)] - §} (30) 
g : <r(t) — ► A t+ V(*) - A t+a {2t + \ - e~ 2t [2t h(2t) + (2t + \) / (2t)] - ^(t)} (31) 

Al exigir la otra condition de la escala de la interaction que 0[c(f)] ~ 2* sobre el valor medio de X(t) 
tranformado por g, entonces A = 2. 

De esta manera, obtenemos una familia de curvas para el valor medio del numero de ancestros a(t), 
parametrizados por a, con la siguiente forma 

a(t) - 2* +1 - 2 t+a {e- 2t [2t h(2t) + (2t + \) I (2t)} - \) (32) 

Hemos descrito nuestra dinamica en terminos de un proceso distinto, pues la ecuacion original (15) hace 
referencia a un proceso de nacimiento y muerte, de manera que la transformacion de gauge g encontrada, 
mapea un problema en el otro. 

El valor de a determina el corte por de a(t) y puede ser determinado si conocemos el tiempo de vida 
medio de la especie bajo estudio. Por lo tanto la distincion entre una especie y otra debe hacerse por medio 
del parametro a. 

3.3 Invariancia de gauge del generador Q 

El proceso de renormalizacion de la teoria no depende la forma explicita del generador infinitesimal homoge- 
neo Q, esto es, la veremos que la transformacion de gauge deja invariante a la ecuacion (15). 

La transformacion de renormalizacion estaba definida por g : P(t) — > P*(*) = A(f)P(f), para mantener 
la forma de la ecuacion (10), al transformar mediante g a la distribucion P(t) debemos introducir una conexion 
afin que se traduce en la existencia de una derivada covariante dada por d t — d t — vc(t), es necesario que 
el conjunto de funciones no nulas {A(t)} que conectan una distribucion con otra a traves de g formen un 
grupo de Lie, hemos demostrado que tal conjunto es el grupo de dilataciones sobre el espacio vectorial al 
cual perteneces P(t). Mostraremos, independientemente de esto, la buena definition de covarianza de d t 
demostrando la invarianza de forma de la ecuacion (10). 

Teniendo en cuenta que todo vector u(i) se transforma por g como g[u(t)] = u*(f) = A(i)u(i) , luego 
(10) se transforma por g en una ecuacion de la forma g[c? t P] = g[QP(t)] = gd t g _1 gP = gQg _1 gP(£) luego 

t P*(t)=gQg- 1 P*(i) 

con QdtQ- 1 = d t 

A(t)d t P{t) = A(t)QP(<) 
dt[A(i)P(i)] - d t A(t)P(t) = QA(i)P(i) 
d t P*{t) - w(t)P*(t) = QP*(t) 
9 t P*(t) = QP*(t) 

por lo tanto gQg -1 = Q con lo cual Q es invariante bajo la transformacion g. 
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4 Resultados 



A continuation mostraremos la forma de las curvas para el valor medio a(t) segiin (32) para distinitos valores 
de a. 




Figure 3: Valor medio a(t), con a = —1,4. Izquierda: observamos el comportamiento a bajas generaciones. Derecha: 
mostramos el comportamiento a altas generaciones. 




Figure 4: Izquierda: observamos el comportamiento del valor medio ct(t), con a = —1.6. Derecha: observamos el compor- 
tamiento del valor medio a(t), con a = —1.9 

Notamos que el parametro a regula el alcance de la interaction, \a\ crece monotonamente con el valor de 
corte por de a(t). A medida que \a\ crece se aproxima al comportamiento de la piramide anecestral 2 t+1 
para bajas generaciones. 

Dado que la varianza contiene la informacion de la dispersion respecto del valor de medio para cada 
generation, definimos a e(t) = y / cr(f) como la fluctuation estocastica respecto del valor medio. Por tanto, 
dado un valor de a, existe toda una banda de curvas perteneciente al conjunto [a(t) — s(t), a(t) + s(t)], en 
la cual se encuentra la informacion sobre el numero medio de ancestros 
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generacion 



Figure 5: Familia de curvas del numero medio de ancestros dada por el conjunto [a(t) — e{t),a{t) + e(t)]. 

Mostramos la entropi'a definida por la teoria de la information [7] como la ignorancia acerca del sistema 




Figure 6: Entropia asociada a la dinamica de ancestros. 

Observamos un comportamiento creciente hacia generaciones pasadas, asociado al crecimiento monotono 
del valor medio de X(i). 

5 Conclusiones 

En el presente trabajo se pretendio construir un modelo que permita calcular la distribution numero de 
ancestros para un individuo de una especie de reproduction biparental utilizando algunos elementos propios 
de la fi'sica actual. A traves de las hipotesis de que la restriction principal en el numero de ancestros se debe 
a la consanguinidad entre individuos cogeneracionales, se propuso una proceso estocastico que lo describi'a 
generacion a generacion, dando lugar a una disminucion en el numero maximo de ancestros posibles en cada 
generacion. A partir de considerar que la relation entre el numero de individuos en una generacion restringe 
la inmediatamente proxima, siguiendo una dinamica del tipo markoviana, se obtuvo una ecuacion que que 
permite, junto con una condition initial, obtener la distribution de probabilidades de obtener un numero n 
de ancestros en la generacion t. 

Luego se rcnormalizo la distribution a traves de una transformation de gauge, para corregir los defectos 
que indutia el tamano del espacio muestral considerado inicialmcntc. Esto pcrmitio reescalear el problcma 
correctamente e interpretar algunos elementos de la teon'a renormalizada, por ejemplo, fijar la escala de la 
interaction en A = 2 y la existencia de un parametro, a, relacionado con la especie particular bajo estudio. 

Finalmente, se calculo la media en el numero de ancestros a(t), la varianza a(t), y la entropi'a S(t), 
asociadas a la distribution. Todas ellas dependientes de a, parametro cuyo valor podria ser fijado a traves 
del tiempo de vida de la especie, tasado como el numero maximo de generaciones de vida promedio. 

El presente modelo podria ser mejorado considerando restricciones adicionales, por eso, creemos que tal 
como lo hemos presentado define un punto de partida para el estudio formal de esta rama de la ciencia. 
Posteriormente, proponemos comparar los resultados que se han obtenido de esta distribution con los datos 
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reales de arboles genealogicos y constatar si el modelo predice correct amente estas cantidades y las que de 
ellas pudieran derivarse. 
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